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Chromat in - Regul at orgene 

Die vorliegende Erfinciung bezieht sich auf Gene, die 
eine Rolle bei der strukturellen und f unktionellen 
Regulation von Chromatin spielen, und ihre Verwendung 
fur die Therapie und Diagnostik. 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere, Telomere sowie in. eu- und 
J heterochromatische Regionen stellt einen entscheidenden 

Mechanismus zur Gewahrleistung der genauen Replikation 
und Verteilung der genetischen Information bei jeder 
Zellteilung dar. Im Gegensatz dazu sind Tumor z el len 
haufig durch chromosomale Rearrangements, 
Translokationen und Aneuploidie charakterisiert 
(Solomon et al . , 1991; Pardue, 1991). Obwohl die 
Mechanismen, die zu einer erhohten 

Chromosomeninstabilitat in Tumorzellen fiihren, noch 
nicht geklart sind, haben es in jungster Zeit eine 
Reihe von experiment el len Systemen, beginnend mit 
telomerischen Positiorisef f ekten in Hefe (Renauld et 
al., 1993; Buck und Shore, 1995; Allshire et al . , 
J 1994) , uber Positionsef f ekt -Variegation (PEV) in 

Drosophila (Reuter und Spierer, 1992) , bis zur Analyse 
von Trans lokationsbruchpunkt en in humanen Leukamien 
(Solomon et al . , 1991; Cleary, 1991), ermoglicht, 
einige chromosomale Proteine zu identif izieren, die an 
der deregulierten Proliferation ursachlich beteiligt 
sind. 

Erstens wurde f estgestellt , daS die Uberexpression 
einer verkurzten Version des SIR4- Proteins zu einer 
verlangerten Lebensdauer in Hefe fiihrt (Kennedy et al . , 
1995) . Da SIR-Proteine zum Entstehen multimerer 
Komplexe an den stillen "Mating Type Loci" und am 
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Telomer beitragen, konnte es sein, daS uberexprimiertes 
SIR4 mit diesen heterochromatinartigen Komplexen 
interf eriert , was schlieSlich zu einer unkontrollierten 
Proliferation f uhrt . Diese Annahme steht im Einklang 
mit der Haufigkeit des Auftretens einer deregulierten 
Telomerenlange in den meisten humanen Krebsarten 
(Counter et al . , 1992). 

Zweitens wurden mittels genetischer Analysen von PEV in 

Drosophila eine Reihe von Genprodukten identif iziert , 

die die Chroma t ins truktur an he t er ochromat i s chen ) 

Positionen und innerhalb des homeotischen Genclusters 

verandern (Reuter und Spierer, 19 : 92) . Mutationen 

einiger dieser Gene, wie modulo (Garzino et al . , 1992) 

und polyhomeotic (Smouse und* Perrimon, 1990) , konnen in 

Drosophila. die deregulierte Zellprolif eration oder den 

Zelltod verursachen. Drittens wurden Saugetierhomologe 

von sowohl Aktivatoren (trithorax oder trx-Gruppe) als 

auch Repressoren (z.B. polycomb oder Pc-Gruppe) der 

Chromatins truktur von homeotischen Drosophila- 

Selektorgenen beschrieben. Unter diesen hat sich vom 

humanen HRX/ALL- 1 (trx-Gruppe) gezeigt, daS es an der 

durch Translokation induzierten Leukamogenese beteiligt 

ist (Tkachuk et al . , 1992; Gu et al . , 1992), und daS 3 

die Uberexpression des Maus-Jbmi (Pc-Gruppe) zum 

Entstehen von Lymphomen fuhrt (Haupt et al . , 1991; 

Brunk et al. , 1991; Alkema et al . , 1995). Ein Modell 

fur die Funktion chromosomaler Proteine laSt darauf 

schlie£en, da£ diese multimere Komplexe bilden, welche 

in Abhangigkeit von der Ausgewogenheit zwischen 

Aktivatoren und Repressoren im Komplex den 

Kondensationsgrad der umliegenden Chromatinregion 

be stimmen (Locke et al . , 1988). Eine Verschiebung 

dieses Gleichgewichts durch Uberexpression einer der 

Komponenten des Komplexes zeigte eine Neuvertei lung von 

eu- und heterochromatischen Regionen (Buck und Shore, 
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1995; Reuter und Spierer, 1992; Eissenberg et al . , 
1992) . Dieser Dosiseffekt kann die Chromatinstruktur an 
vorbestimmten Loci destabilisieren, was letztlich zu 
einem Ubergang vom normalen zum transf ormierten Zustand 
f uhrt . 

Trotz der Charakterisierung von HRX/ALL-1 und hmi al-s 
Protoonkogene, die die Chromatinstruktur verandern 
konnen, ist das Wissen iiber Saugetiergenprodukte , 
welche mit Chromatin wechselwirken, noch sehr 
beschrankt. Im Gegensatz dazu wurden durch genetische 
Analy'sen von PEV in Drosophila ca. 120 Allele fur 
Chromatinregulatoren beschriebeh (Reuter und Spierer, 
1992) . Kiirzlich wurde eine carboxyterminale Region mit 
Ahnlichkeit in der Sequenz identif iziert , die einem 
posit iven (_trx, trx- Gruppe) und einem negativen iE(z) , 
Pc-Gruppe) Drosophila-Chromatinregulator (Jones und 
Gelbart, 1993) gemeinsam ist. Dariiberhinaus ist dieser 
Carboxyterminus auch in £u(var)3-9, einem dominanten 
Supressor der Chromat invert ei lung in Drosophila, 
konserviert (Tschiersch et al. # 1994). 

Bei der vorliegenden Erfindung wurde von der Uberlegung 
ausgegangen, daS diese als "SET" bezeichnete 
Proteindomane (Tschiersch et al., 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein in 
antagonistischen Genprodukten eine neue Genfamilie 
entwicklungsgeschichtlich wichtiger Saugetier- 
Chromatinregulatoren def iniert . Daruberhinaus tragt die 
Charakterisierung- weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufklarung der 
Mechanismen bei, die dafiir verantwortlich sind, da£ 
strukturelle Veranderungen im Chromatin zur malignen 
Transformation fiihren konnen. 
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Der vorliegenden Erfindung lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu 
identif izieren, ihre Funktion aufzuklaren und sie fur 
die Diagnostik und Therapie einzusetzen. 

Zur Losung dieser Aufgabe wurde zunachst die 
Sequenz information der SET-Domane benutzt, urn aus 
humanen cDNA-Banken die zu den SET-Domane -Genen von 
Drosophila homologen humanen cDNAs zu erhalten. Es 
wurden zwei cDNAs erhalten, die Humanhomologe von E(z) 
bzw. Su(var)3-9 darstellen; die entsprechenden humanen 
Gene wurden als EZH2 und SUV39H bezeichnet (vgl. 
unten) ; auSerdem wurde eine variante Form von EZH2 
identif iziert, die als EZH1 bezeichnet wurde. 

Die vorliegende Erfindung betrifft somit DNA-Molekiile, 
enthaltend eine fur ein Chromat inregulator - Protein f das 
eine SET-Domane aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , da£ sie die 
in Fig. 6 oder in Fig. 7 dargestellte Nukleotidsequenz 
aufweisen. Die erf indungsgemafien DNA-Molekule werden im 
folgenden auch als . "erf indungsgemaSe Gene" bezeichnet. 

Die erf indungsgemaSen Gene tragen die Bezeichnung EZH2 
und SUV39H, sie wurden ursprunglich als "HEZ-2" und 
" H3 - 9 11 bezeichnet. 

Die Erfindung betrifft in einem weiteren Aspekt die von 
diesen Genen abgeleiteten cDNAs , einschlieSlich ihrer 
degenerierten Varianten; Mutanten, die fur funktionelle 
Chromat inregulator en kodieren sowie Varianten, die auf 
eine Genduplikation zuruckzuf uhren sind; ein Beispiel 
dafiir ist EZH1, dessen Teilsequenz im Vergleich mit 
EZH2 in Fig. 8 dargestellt ist. 
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Zur Losung der im Rahmen der vorliegenden Erfindung 
gestellten Auf gabe wurde im einzelnen wie f olgt 
vorgegangen: Ausgehend von der Sequenzinf ormation von 
der konservierten SET-Domane, wurde unter reduzierter 
Stringenz eine humane B-Zell-spezif ische cDNA- 
Bibliothek mit feiner gemischten Djrosophila-DNA-Sonde , 
die fur die SET-Domanen von E{z) und Su(var) 3-9 
kodiert, gescreent. Aus 5 0 0.000 Plaques wurden 40 
primare Phagen ausgewahlt . Nach zwei weiteren Runden 
Screening zeigte sich, daS 31 Phagen fur authentische 
) E(z) -Sequenzen kodieren und da£ fiinf Phagen E{z) - 

Varianten darstellen. Im Gegensatz dazu hybridisierten 
nur zwei Phagen mit der. Sonde, die die SET-Domane von 
5u(var) 3-9 allein enthielt . Die Phageninserts wurden 
mittels Polymerasekettenreaktion (PCR) amplif iziert und 
mittels Restriktionskartierung und Teilsequenzierung 
analysiert. Representative cDNA- Inserts wurden 
subkloniert und liber ihre ganze Lange sequenziert. Die 
5 ! -Enden wurden isoliert, indem positive Phagen. noch 
einmal mit 5 1 -DNA-Sonden gescreent wurden, worauf nach 
Subklonierung komplette cDNAs erhalten wurden. 

Die komplette/ fur das humane Homologe von E(z) 
* kodierende cDNA wurde als EZH2 und die DNA, die fur das 

humane Homologe von Su ( var) 3-9 kodiert, wurde als 
SUV39H bezeichnet . Insgesamt betragt die Identitat der 
Aminosauren zwischen Drosophlla. und den humanen 
Proteinen 61 % fur. EZH2 und 43 % fur SUV39H, wobei die 
C-terminale SET-Domane sehr hoch konserviert ist 
(88 % fur EZH2 und 53 % fur SUV39H) . Der 
Sequenzvergleich zeigte weitere deutliche 
Homologieregionen, z.B. eine Cystein-reiche Domane in 
EZH2 und eine Chromo-Box in SUV39H. (In polycomb wurde 
gezeigt, daS die Chromo-Box die fur die. Wechselwirkung 
zwischen DNA und Chromatin wesentliche Domane ist; 
Messmer et al . , 1992). Im Gegensatz dazu fehlen die 
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20 7 Aminosauren, die das aminoterminale GTP- 
Bindungsmotiv des Drosophi 1 a- Proteins enthalten, im 
humanen Homologen SUV39H. 

Der Vergleich der Aminosaure-Sequenzen zwischen den 
Drosophila- und den humanen Genen ist in den Fig. 1 
und 2 dargestellt : 

Fig. l zeigt den Vergleich der Aminosaure-Sequenz 
zwischen EZH2 und von Drosophila Enhancer von zeste 
(E(z)), Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Cys-reichen Region (Cys-Reste sind hervorgehoben) sind 
gezeigt. Die mutma£lichen Kernlokalisierungssignale 
sind unterstrichen. 

Fig. 2 zeigt den Vergleich der Aminosaure-Sequenz 
zwischen dem humanen Homologen SUV39H und Drosophila 
Su(var)3-9. Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Chromo-Domane (dunkler schattierte Box) sind 
dargestellt. Die mutmaElichen kernlokalisierungssignale 
sind unterstrichen. Oben in der Figur ist eine 
schematische Ubersicht der beiden Proteinstrukturen 
dargestellt , die zeigt, dafi im humanen Homologen 
20 7 Aminosauren am N-Terminus fehlen. 

Da translationale Consensussequenzeh in Umgebung des 
Start -ATG der humanen SUV39H- cDNA auch an der 
entspre.chenden internen Position in Su(var) 3-9 
vorhanden sind, durfte das Drosophila-Protein 
zusatzliche Exons enthalten, die in einem spateren 
Stadium der Evolution fur die Funktion entbehrlich 
warden. (Die Richtigkeit dieser Hypothese karm 
bestatigt werden, indem die humane SL7V3SH-cDNA und 
komplette oder am 5 1 -Ende verkiirzte cDNAs von 
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Su(var) 3-9 in Drosophila exprimiert werden. 
Dariiberhinaus wurde eine weitere cDNA der Bezeichnung 
MG-44 beschrieben 

(s. unten) ; der ebenfalls das .5"-Ende des Drosophila- 
Gens fehlt.) Zusatzlich zur humanen cDNA von SUV39H 
wurde auch der homologe Locus in der Maus (Suv3 9h; 
siehe unten) isoliert, dessen Sequenzanalyse und 
Promotorstruktur eindeutig die aminoterminale 
Verkurzung saugerhomologer Gene im Vergleich zu 
Drosophila Su (var) 3-9 bestatigt. 

J ■ 

Im Rahmen der vorliegenden Erfindung durchgef iihrte DNA- 
Blot-Analysen deuten darauf hin, dafi saugerhpmologe 
Gene von Su (var) 3-9 in der Maus und im Menschen von 
einzelnen Loci reprasentiert werden, wahrend 
saugerhomologe Gene von E (z) in der Maus und im 
Menschen durch zwei getrennte Loci kodiert sind. Der 
zweite humane Locus (als EZH1 bezeichnet) wurde auch 
durch Charakterisierung einer kleinen Anzahl von cDNA- 
Varianten, die sich in ihren 3 1 -f lankierenden Sequenzen 
von der Mehrzahl der aus der humanen cDNA-Bibliothek 
is.olierten Klone unterscheiden, bestatigt. Die 
Unterschiede zwischen EZH2 und EZH1 im sequenzierten 
■J Bereich sind in Fig. 8 dargestellt : Die SET-Domane von 

EZH1 zeigt gegenuber EZH2 Mutationen; auSerdem tragt 
die von uns isolierte EZH1 -Variant e (sehr 
wahrscheinlich eine aberrant gespleiBte cDNA) ein sich 
im Leserahmen befindliches Stopcodon, welches das 
Protein urn die 47 C-terminalen Aminos auren. verkurzt . In 
Fig. 8 ist die Nukleotidsequenz der £ZH2-cDNA von 
Position 1844 bis 2330 in der jeweils oberen Zeile 
dargestellt, wobei die 5 1 SpleiBstelle und das 
potent ielle Stopcodon unterstrichen sind. Urn eine 
Teilsequenz der cDNA der EZH1- Var i ante der £ZH2-Sequenz 
zuzuordnen, wurde das gap-Programm des Wisconsin GCG 
Netzwerkservice verwendet . Das vorzeitige Stopcodon in 
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EZH-1 (Position 353) ist unterstrichen. . Sequenzen, die 
fur die konservierte SET-Domane kodieren, sind 
hervorgehoben . Aufierdem ist das 3 1 -Ende (Position 151 
in EZH1) des aberranten Transkripts B52 (s. unten) 
dargestellt. Uber die verfugbare Sequenz zeigte sich 
B52 zu 97 % identisch mit EZH1 und zu 72 % identisch 
mit EZH2. Der Sequenzvergleich von EZH1 mit EZH2 sowie 
die Feststellung, daS beitn Menschen und der Maus zwei 
getrennte E (z) -homologe Loci auf'treten, lassen darauf 
schliefien, da£ bei Saugern eine Genduplikation 
aufgetreten ist. . 

In einem Vergleieh mit cDNA-Sequenzen in der Datenbank 
GeneBank wurde iiberraschend f estgestellt / daS bestimmte 
in der Datenbank eingetragene cDNA-Teil sequenzen, die 
von aberranten Transkripten in Tumorgeweben abgeleitet 
sind # mutiert'e Versionen der erfindungsgemaSen cDNAs 
darstellen: 

Einerseits war auf der Suche nach BRCA1 , einem Gen, das 
fur Brust- und Eileiterkrebs pradisponiert , eine 
partielle cDNA-Sequenz mit 271 Nukleotiden der 
Bezeichnung B52, die fur eine mutierte Variante der 
SET-Domane kodiert, isoliert und auf dem humanen 
Chromosom 17q21 kartiert worden (Friedman et al . , 
1994) . Es wurde im Rahmen der vorliegenden Erfindung 
iiberraschend f estgestellt , daS B52 97 % Identitat mit 
der erfindungsgemaSen .EZHI-cDNA- Variante aufweist (vgl. 
oben) ; moglicherweise stellt EZH1 ein Gen dar, dessen 
Reaktivierung bei der deregulierten Proliferation eine 
Rolle spielt . 

Andererseits war eine cDNA (2.800 Nukleotide; MG-44) 
vom humanen Chromosom Xpll isoliert worden (Geraghty 
et al., 1993), einer Region, die fur degenerative 
Storungen der Netzhaut und Synovialsarkome 
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pradisponiert . Es wurde uberraschend f estgestellt , da£ 
diese cDNA 98 % I dent it at mit der erf indungsgemafien 
SUV3 5H- cDNA aufweist. 

Die im Rahmen der vorliegenden Erfindung 

bereitgestellten neuen Gene ermoglichen es somit, einen 
Zusammenhang zwischen bestimmten Krebserkrankungen und 
Mutationen in Chromatinregulatoren herzuleiten; im 
Falle der MG-44-cDNA konnte, da diese mehrere Punkt- 
und Frameshift -Mutationen aufweist, welche die Chromo- 
und SET-Domanen unterbrechen, erst anhand der 
er f indungsgemafien 

SUV3 9H- cDNA ein Zusammenhang zwischen Su(var) 3-9 und 
MG-44 aufgeklart werden. 

Neben den bereits genannten Seguenzen sind in der 
Sequenzdatenbank GeneBank als weitere humane Mitglieder 
der SET-Proteinf amilie das gut dokumentierte humane 
Homo loge von Drosophlla. trx, HRX/ALL-1 (Tkachuk et al . , 
1992; Gu et al ., 1992) eingetragen, ferner ein Gen 
unbekannter Funktion der Bezeichnung G9a, das im 
humanen Major Histocompatibility Complex (Milner und 
Campbell, 1993) vorhanden ist, dritteris eine nicht . 
publizierte cDNA (KG-1) , die aus unreifen myeloiden 
Tumorzellen isoliert wurde (Nomura et al., 1994). 
Wahrend G9sl derzeit das einzige humane Gen mit einer 
SET-Domane ist, fur das bisher ke.ine mutierte Version 
bekannt ist., tragt KG-1 eine Insertion von 342 
Aminosauren, welche die SET-Domane in eine Amino- und 
eine Carboxyterminale Halfte spaltet . Wahrscheinlich 
stellt diese JCG-l-cDNA eine aberrant gespleifite 
Variante dar, da sich 5 f und 3 1 Konsensus-SpleiSstellen 
and beiden Enden der Insertion finden. Insgesamt sind 
vier der funf derzeit bekannten humanen Mitglieder der 
SET-Proteinf amilie Anderungen unterworfen, die alle die 
SET-Domane mutieren (HRX/ALL-1, EZH1/B52, SUV39H/MG-44 
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und KG-1) . Dariiberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Translokationsbruchpunkten oder instabilen 
chromosomal en Regionen kartiert (HRX/ALL-1, EZH1/B52 
und SUV39H/MG-44) . In Fig. 3 sind die aberranten 
Transkripte von humanen SET-Domane-Genen dargestellt. 
Links in der Figur ist die Lage der funf derzeit 
bekannten SET-Domane-Gene auf dem jeweiligen Chromosom 
angegeben. U.a. sind die drei Gene {HRX/ALL-1, EZH1/B52 
und SUV39H/MG-44) , fur die aberrant e cDNAs auf 
Translokationsbruchpunkten oder instabilen 
Chromatinregionen kartiert wurden, dargestellt. Vier 
der funf dargestellten SET-Domanen Gene weisen 
Mutationen auf, die alle die Carboxyterminale SET- 
Domane unterbrechen, welche in der Figur durch die 
dunkle Box dargestellt ist. Eirie Translokation 
verbindet die aminoterminale Halfte von HRX mit einer 
nicht korrelierten Gensequenz, die als gepunktete Box 
mit der Bezeichnung ENL dargestellt ist. Mutationen und 
ein vorzeitiges Stopcodon verandern die SET-Domane von 
EZH1/B52 . Punkt- und Frameshif t-Mutationen unterbrechen 
die Chromo- und SET-Domane in MG-44. Eine groSe 
Insertion spaltet die SET-Domane von KG-1 in zwei 
Half ten. Aberrante Transkripte sind derzeit fur G9a 
nicht bekannt. Das Gystein-reiche Cluster in B52 ist 
als gepunktete Box dargestellt; in HRX/ALL-1 sind die 
Homologieregion zu Methyltransf erasen als schraffierte 
Box und die A/T-Haken als vertikale Linieh dargestellt . 
Die Namen der jeweiligen authentischen Gene sind rechts 
in der Figur angegeben. 

Die Tatsache, daS ein Saugetiergen der SET- 
Proteinf amilie, HRX/ALL-1, mit translokations- 
induzierter Leukamogenese im Zusammenhang gebracht 
wurde (Tkachuk et all, 1992; Gu et al . , 1992), ist ein 
starker Hinweis dafur, daS Proteine mit der SET-Domane 
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nicht nur wichtige Regulatoren der. Entwicklung sind, 
die chroma tinabhangige Veranderungen. der Genexpression 
mitbestimmen, sondern da£ sie, nach Mutation, auch die 
normale Zellprolif eration storen. 

Da alle bisher . beschriebenen Mutationen die 
Primarstruktur der SET-Domane unterbrechen, liegt die 
Vermutung nahe, daE es die SET-Domane als solehe ist, 
die eine entscheidende Rolle im Ubergang vom normalen 
zum transf ormierten Zustand spielt . Eine wichtige 
Funktion fur die SET-Domane karin ferner aufgrund ihrer 
evolutionaren Konservierung in Genprodukten, die von 
der Hefe bis zum Menschen auftreten, vermutet werden . 

Fig. 4 zeigt die evolutionare Konservierung von SET- 
Domane-Proteinen: Unter Verwendung des tf asta-Programms 
des Wisconsin GCG Netzwerkservice wurden Proteine und 
offene Leserahmen mit Homologie zur SET-Domane 
identif iziert . In der Figur ist eine representative 
Auswahl von Hefe bis zum Menschen gezeigt. Ziffem 
geben Aminosauren an. Die Carboxyterminale SET-Domane 
ist durch eine schwarze Box dargestellt, Cys -seiche 
Regionen durch eine dunkel gepunktete Box, das GTP- 
Bindungsmotiv in Su(var)3-9 durch eine hellgepunktete 
Box und die Chromo-Domane von Su (var) 3-9 und H3-9 durch 
eine offene Box mit hellen Punkten. Eine Region mit 
Homologie zu Methyltransf erase ( trx und HRX) ist als 
schraffierte Box dargestellt. A/T-"Haken" ( 11 A/ T Hooks") 
sind durch vertikale Linien dargestellt. Eine weitere 
Ser-reiche Region (S in C26E6.10) und eine Glu-reiche 
Region (E in G9a) oder Ankyrin-Repeats (ANK in G9a) 
sind ebenfalls hervorgehoben . YHR119 (GeneBank 
Accession No. U00059) und C26E6.10 (GeneBank Accession 
No. U13 875) sind offene Leserahmen von kurzlich in die 
Datenbank- eingetragenen Cosmiden ohne eine funktionelle 
Charakterisierung . Prozente geben die Gesamtheit der 



BNSDOCID <WO 



&635764A2 I > 



WO 96/35784 



12 



PCT/EP96/01818 



Aminosaure- Identitaten zwischen den humanen und den 
Drosophila.- Proteinen an. 

Fig. 5 zeigt die Ubereinstimmung an Aminosauren der 
SET-Domane\ Die SET-Domane der in Fig. 4 dargestellten 
Gene wurde unter Verwendung des Pileup-Programms des 
Wisconsin GCG Net zwerkserviee angeordnet . Fur den 
Vergleich der KG-1- SET- Domane wurde vor dem Pileup die 
groSe Aminosaure - Insertion, die die SET-Domane in zwei 
Half ten spaltet, entfernt. Aminosaure -Pos it ionen, die 
8 von 10 Ubere ins t immungen aufweisen, sind 
hervorgehoben . 

Aufgrund der im Rahmen der vorliegenden Erf indting 
festgestellten Kriterien erweist sich eine, Beteiligung 
der Gene, die eine SET-Domane haben, an der 
chr omat inabhangigen Entstehung- der deregulierten 
Proliferation; diese Gene bzw. die da von abgeleiteten 
cDNAs sowie Teil- und mutierte Seguenzen konnen somit 
bei der Therapie und Diagnose von Erkr ankungen , die auf 
eine derartige Proliferation zuruckzuf uhren sind, 
eingesetzt werden: 

Unterschiede im Transkriptionsniveau von SET-Domane - 
RNAs zwischen normalen und transf ormierten Zellen 
konnen als diagnostischer Parameter fur Erkrankungen 
herangezogen werden, in denen die Expression von SET- 
Domane-Genen dereguliert ist: 

So konnen Oligonukleotide , kodierend fur die SET-Domane 
als solche bzw. Teilabschnitte davon, als 
diagnostischer Marker verwendet werden, urn bestimmte 
Krebsarten, in denen die SET-Domane mutiert ist, zu 
diagnostizieren. Fur die detaillierte Analyse der 
Funktion der erf indungsgemaSen cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Einsatz von 
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SET - Domane - Gens equenz en wurden im Rahmen der 
vorliegenden Erfindung die homologen Maus-cDNAs von 
EZH1 (Ezhl) und SUV39H (Suv39h) isoliert . Bei 
Verwendung einer Maus-spezif ischen, fur die SET-Domane 
kodierenden, DNA- Sonde in "RNAse protection" Analysen 
zur Untersuchung der Ezhl-Genaktivitat wahrend der 
normalen Mausentwicklung zeigte sich ein eher breites 
Expressionsprof il , das ahnlich dem von bmi (Haupt et 
al., 1991) ist. Die mit den Maussequenzen 
durchgef uhrten Analysen werden mit Humanseguenzen 
ausgeweitet, urn die RNA-Mengen zwischen unreifen 
Vorlauferzellen, Tumorzellen und dif f erenzierten Zellen 
in verschiedenen humanen Zellkultursystemen zu 
vergleichen. Um f estzustellen, ob sich die SET-Domane 
dementsprechend als diagnostischer Tumormarker fur 
spezifische Krebserkrankungen oder als.genereller 
diagnostischer Parameter eignet, konnen gangige 
Methoden' zur Bestimmung der RNA-Konzentration, die in 
einschlagigen Laborhan&buchern (Sambrook, J., Fritsch, 
E.F. und Maniatis, T., 1989, Cold Spring Harbor 
Laboratory Press) beschrieben sind, wie Northern Blot, 
Sl-Nuclease-Protection-Analyse oder RNAse- Protect ion - 
Analyse, verwendet werden. 

Um die Haufigkeit zu untersuchen, mit der die SET- 
Domane spezif ischen Mutationen unterliegt, konnen die 
SET- spez if ischen DNA-Sonden zur Analyse von 
Einzelstrang-Konf ormationspolymorphismen (single strand 
conformation polymorphisms; SSCP; Gibbons ef al., 1995) 
eingesetzt werden. 

Krebsarten, bei denen SET-spezif ische DNA-Sonden als 
diagnostischer Marker verwendet werden konnen, sind 
Brustkrebs (EZH1; Friedman et al . , 1994), 
Synovialksarkom (SDV39H; Geraghty et al.; 1993) und 
Leukamien. 
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Aufgrund der Kenntnis der Nukleotidsequenz der SET- 
Domane-Gene konrien die entsprechenden von der cDNA- 
•Sequenz abgeleiteten Proteine, die ebenfalls Gegenstand 
der vorliegenden Erfindung sind, in rekombinanter Form 
herstellt werden, indem die dafiir kodierenden cDNAs in 
geeignete Vektoren inseriert und in Wirtsorganismen 
exprimier-t werden. Die fur die Produktion rekombinanter 
Proteine verwendeten Techniken sirid dem 

Durchschnittsf achmann gelauf ig und konnen einschlagigen 
Handbuchern (Sambrook, J. , Fritsch, E.F. und 
Maniatis, T. , 1989, Cold Spring Harbor Laboratory 
Press) entnommen werden. 

Gegenstand der vorliegenden Erf indung sind somit in 
einem weiteren Aspekt rekombinante DNA-Molekule , 
enthaltend die. fur EZH2, SUV39H oder EZH1 kodierende 
DNA sowie damit funktionell verbundene 
Expressionskontrollseguenzen, sowie die damit 
transf ormierten Wirtsorganismen. 

Die erf indungsgemaSen rekombinanten Proteine konnen 
eingesetzt werden, um die Wechselwirkung von SET- 
Domane-Proteinen mit Chromatin bzw. mit anderen 
Mitgliedern von Heterochromatinkomplexen zu 
analysieren; ausgehend von den dabei erhaltenen 
Erkenntnissen uber die Wirkungsweise dieser Komplexe 
werden die sich im einzelnen ergebenden Moglichkeiten 
fur das gezielte Eingreifen in die daran beteiligten 
Mechanismen definiert und konnen f ur therapeutische 
Anwendungen genutzt werden. 

Untersuchungen, die der weiteren Analyse der Funktion 
der SET-Domane dienen, werden z.B. durchgef iihrt , indem 
cDNAs , kodierend fur humanes EZH2 bzw. SUV39H und 
versehen mit einem Epitop, gegen das Antikorper zur 
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Verfugung stehen, in vitro spwie in Gewebekulturen 
exprimiert werden. Nach Immunprazipitation mit den 
jeweiligen epitopspezif ischen Antikorpern kann 
festgestellt werden, ob EZH2 und SUV39H miteinander 
in vitro wechselwirken konnen und ob in vivo eine 
Kornplexbildung zwischen EZH2 und/oder SUV39H mit 
weiteren Chromat inregulatoren stattfindet. 

Es wurde bereits von anderen Autoren angenommen 
(DeCamillis et al., 1992; Rastelli et al . , 1993; 
Orlando und Paro, 1993), da£ eine Kornplexbildung 
zwischen verschiedenen Mitgliedern von 

Heterochromatinproteinen wesentlich fur deren Funktion-. 
ist . Aufgrund der Verf ugbarkeit der erf indungsgemaSen 
SET -Domane- Gene kann festgestellt werden, ob die SET- 
Region eine Domane darstellt, die aufgrund von 
Wechselwirkungen f unktioniert , oder ob sie zum 
Entstehen multimerer heterochromatischer Komplexe 
beitragt. Ebenso kann festgestellt werden, ob die SET- 
Doraane eine inhibitorische Funktion hat, ahnlich der 
aminoterminalen BTB-Domane verschiedener 
Chromat inregulatoren, einschlieSlich des GAGA-Faktors 
(Adams et al . , 1992) . Insgesamt erlauben die Analysen 
von- Wechselwirkungen mit Epitop-versehenen EZH2- und 
SL7V3PH-Proteinen eine weitere Charakterisierung der 
Funktion der SET-Domane . Dadurch werden Moglichkeiten 
eroffnet, gegen die deregulierte Aktivitat vorzugehen, 
indem z.B. mittels gentherapeutischer Methoden 
dominant -negative Variant en der SET - Domane - cDNA- 
Sequenzen in die Zelle . eingef uhrt werden. Derartige 
Varianten werden z . B . erhalten, indem zunachst die 
f unktionellen Domanen der SET-Proteine definiert 
werden, z.B. die fur die DNA/ Chromat in- oder die fur 
die Protein/Protein-Wechselwirkung verantwort lichen 
Sequenzabschnitte, und indem dann die urn die 
jeweilige(n) Domane (n) oder urn Abschnitte davon 
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verkiirzten DNA-Sequenzen in der betroff enen Zelle zur 
Expression gebracht werden, um eine durch das intakte 
funktionelle Protein verursachte Deregulation der 
Proliferation zu kompetitieren. 

Die Verf ugbarkeit der erf indungsgemafien cDNAs erlaubt 
ferner die Herstellung transgener Tiere, z.B. Mause, in 
denen SET-Domane-Gene entweder uberexprimiert werden 
konnen ( 11 gain-of- function" ) oder in denen diese Gene 
ausgeschaltet werden konnen ( "loss-of -function" ) ; fur 
letztere Analysen werden die korrespondierenden 
Tiersequenzen, insbesondere Maussequenzen, der 
erf indungsgemaBen Gene eingesetzt. Diese Mause sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Insbesondere gibt die "gain-of -function" - Analyse, bei 
der Allele der erf indungsgemaBen Gene in die Maus 
eingefiihrt werden, letztlich AufschluS uber die 
ursachliche Beteiligung von EZH2 und SUV39H an der 
chromatinabhangigen Forderung der Tumorentstehung . Fur 
die "gain-of -function" - Analyse konnen die kompletteri 
cDNA-Sequenzen von humanem EZH2 und SUV39H sowie deren 
mutierte Versionen, wie EZH1/B52 und MG-44, mittels 
Vektoren, die hohe Expressionsraten ermoglichen/ z.B. 
Plasmiden mit dem humanen £ - Ac t in - Promo t or , getrieben 
sowohl vom Enhancer der schweren Kette von 
Immunglobulinen (E/i) als auch von Moloney- Virus - 
Enhancern (Mo-LTR) . Kiirzlich wurde gezeigt, daS die 
E/x/Mo-LTR-abhangige Ub.erexpression des Jbmi-Gens, 
welches gemeinsam mit EZH2 zur Pc-Gruppe negativer 
Chrpmatinregulatoren zahlt, ausreicht in transgenen 
Mausen Lymphome zu erzeugen (Alkema et al . , 1995) . 

Indem in "loss-of -function" -T^nalysen die endogenen 
Maus-Loci fur Ezhl und Suv39h durch homologe 
Rekombination in embryonalen Stammzellen unterbrochen 
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werden, kann bestimmt werden, ob der Verlust der 

in vivo-Genfunktion zu einer abnormalen Entwicklung der 

Maus f lihrt 

Aufgrund dieser in vivo-Systeme kann die Wirkung von 
EZH2 und SUV39H bestatigt werden; diese Systeme dienen 
auEerdem als Grundlage fur Tiermodelle im Hinblick auf 
eine humane Gentherapie. 

Der gentherapeutische Einsatz der erf indungsgemafien 
DNA-- Sequenzen oder davon abgeleiteter Sequenzen (z.B. 
komplementarer Antisenseoligonukleotide) erfolgt - je 
nachdem, ob die zu behandelnde Erkrankung auf eine 
Deregulation von Chromatin infolge. des Fehlens der 
f unktionellen Gensequenz, oder aber infolge einer 
Uberexpression der entsprechenden Gene zuruckzuf uhren 
ist - durch Einfuhrung der f unktionellen Gensequenz, 
durch Inhibierung der Genexpression, z.B. mit Hilfe von 
Antisenseoligonukleotiden, oder durch Einfuhrung einer 
fur eine dominant -negative Mutante kodierenden Sequenz. 
Die Einfuhrung der jeweiiigen DNA- Sequenzen in die 
Zelle kann mit Hilfe von Standardmethoden fur die 
Transfektion hoherer eukaryotischer Zellen erfolgeii, zu 
denen der Gentransfer mittels viraler Vektoren 
(Retrovirus, Adenovirus, Adeno-assoziiiertes Virus) 
oder mittels nicht-viralen Systemen auf Basis der 
Rezeptor-vermittelten Endozytose zahlen; Ubersichten 
uber gebrauchliche Methoden werden z.B. von Mitani und 
Caskey, 1993; Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zatloukal et al . , 1993, 
WO 93/07283 gegeben . 

Fur eine Inhibierung der Expression der 

erf indungsgemaEen Gene kommen auch niedermolekulare 

Substanzen in Betracht , die in die. 

Transkriptionsmaschinerie eingreifen; nach Analyse der 
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5 1 -regulatorischen Region der Gerie kann nach Substanzen 
gescreent werden, die die Wechselwirkung der jeweiligen 
Transkriptionsf aktoren mit dieser Region ganz oder 
teilweise blockieren, z.B. mit Hilfe der in der 
WO 92/13092 beschriebenen Methode . 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechenden 
Antikorper gegen das EZH2- oder SUV39H- Protein, 
vorzugsweise humane oder humanisierte Antikorper, 
therapeutisch eingesetzt werden. Die Herstellung 
solcher Antikorper erfolgt nach bekannten Methoden, wie 
sie z.B. von Malavsi und Albertini, 1992, oder von 
Rhein, 1993, beschrieben wurderi. 

Antikorper gegen EZH2 oder SUV39H, die therapeutisch 
oder diagnostisch verwendet werden konnen, sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 
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Aminosaure-Sequenzvergleich zwischen EZH2 
und E(z) 

Aminosaure - Sequenzvergl e ich zwischen SUV39H 
und Su ( var) 3-9 

Aberrante Transkripte von humanen SET-Domane- 
Genen 

Evolutionare Konservierung von SET-Domane- 
Proteinen 

Aminosaure -Ubereinstimmung in der SET-Domane 
DNA- und Aminosaure - Sequenz von EZH2 
DNA- und Aminosaure -Sequenz von SUV39H 
partieller Sequenzvergleich zwischen den 
cDNAs von humanem EZH2 und EZH1 



WO 96/35784 



19 



PCT/EP96/01818 



Beispiel 

a) Herstellung einer. cDNA-Bibliothek 

Es wurde eine humane B-Zell - spezif ische cDNA- 
Bibliothek, wie von Bardwell und Treisman, 1994 , 
beschrieben, hergestellt, indem Poly (A) +-RNA aus 
hu'manen BJA-B-Zellen isoliert, mittels Poly(dT)i5- 
Priming revers transkribiert und in doppelstrangige 
cDNA kpnvertiert wurde. Nach Zugabe eines EcoRi- 
Adapters der Seguenz 5 1 AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI -Stelle des Bakteriophagen gtl.O 
ligiert. Die Propagierung und Amplif izierung der 
Bibliothek erfolgte in E.coli C600. 

b) Herstellung von DNA-Sonden 

Drosophl 1 a- DNA-Sonden, kodierend fur die konservierten 
SET-Domanen von E{z) und Su(var) 3-9, wurden auf der 
Grundlage der publizierten JDrosophila-Sequenzen (Jones 
und Gelbart, 1993; Tschiersch et al., 1994) mittels- 
Polymerasekettenreaktion (PCR) hergestellt: 1 /ig von 
Drosophlla. melanogas ter-DNA (Clontech) wurde mit den 
beiden Primern E(z) 1910 

( 5 1 ACTGAATTCGGCTGGGGCATCTTTCTTAAGG ) und E{z) 22 BO 
(5 1 ACTCTAGACAATTTCCATTTCACGCTCTATG) einer PCR- 
Amplif ikation (35 Zyklen zu 3 0- sek bei 94 °C, 3 0 sek bei 
55°C und 30 sek bei 72°C) unterworfen. Die 
entsprechende SET-Domane- Sonde fur Suivar) 3-9 wurde von 
10 ng Plasmid-DNA (Tschiersch et al . , 1994; Klon M4) 
mit dem Primerpaar suvar.up 

(5' ATATAGTACTTCAAGTCCATTCAAAAGAGG) und suvar . dn 
( 5 1 CCAGGTACCGTTGGTGCTGTTTAAGACCG) amplif iziert , wobei 
dieselben Zyklusbedingungen verwendet wurden. Die 
erhaltenen SET-Domane-DNA-Fragmente wurden Gel- 
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gereinigt und teilsequenziert , urn die Richtigkeit der 
amplif izierten Seguenzen zu bestatigen. 

c) Screenen der cDNA-Bibliothek 

5 x 10 5 Plaque-bildende Einheiten ("plaque forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 
Wirtsstammes E.coli C600 (bei einer optischen Dichte 
OD 600 von °- 5 in 10 mM MgS04 suspendiert) bei 37°C 
15 min lang inkubiert und dann auf eine gro£e (2 00 mm 
x 20 0 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum iiber Nacht bei 37 °C wurden die Phagen auf 
einer Nylonmembran (GeneScreen) absorbiert . Die Membran 
wurde, die Seite mit den absorbiert en Phagen nach oben 
schauend, 30 sek lang in Dena tur i erungs 1 osung (1.5 M 
NaCl, 0.5 M NaOH) schwimmen gelassen, dann 60 sek in 
Denaturierungslosung eingetaucht und abschlieSend 5 min 
lang in 3 M NaCl, 0.5 M Tris pH 8, neutralisiert . Dann 
wurde die Membran kurz in 3xSSC gespult und die Phagen- 
DNA mittels UV-Vernetzung auf das Nylonfilter f ixiert . 
Das Filter wurde 30 min lang bei 50°C in 30 ml Church- 
Puffer (1 % BSA, 1 mM EDTA und 0.5 M NaHP0 4 , pH 7.2) 
prahybridisiert , anschlieSend wurden 2 x 10 6 cpm der 
radioaktiv markierten DNA-Sondenrriischung (E{z) -SET und 
Su ( var) 3-9-SET) zugegeben; die DNA-Sonden wurden durch 
Random-priming unter Verwendung des RediPrime-Kit 
(Amersham) hergestellt. Die Hybridisierung wurde uber 
Nacht bei 50°C durchgef uhrt . Nach Entfernung der 
Hybridisierungslosung wurde das Filter 10 sek in 2xSSC # 
1 % SDS bei Raumtemperatur gewaschen, anschlieEend 
wurde 10 sek lang bei 50 °C gewaschen. Das Filter wurde 
in Saranwrap gewickelt und unter Verwendung einer 
Verstarkerf olie der Autoradiographic unterworfen. 

Positive Phagenkolonien wurden auf der Originalplatte 
mittels Zuordnung des Autoradiogramms identif iziert und 
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die entsprechenden Agarstuckchen mit dem grofieren Ende 
einer Pasteur-Pipette entfernt, Der Phagen-Pool wurde 
uber Nacht bei 4°C in 1 ml SM-Puffer (5,8 g NaCl, 2 g 
MgS04-H 2 0 / 50 ml Tris pH 7.5, 5 ml 2 %ige Gelatine auf 
1 1 H 2 0) , enthaltend einige Tropfen CHC1 3 , eluiert. 
Das Phagenlysat wurde fur eine zweite und dritte 
Screeningrunde wieder ausplattiert urn einzelne, gut 
isolierte positive Plaques (20 bis 100 Plagues pro 
Platte, in der dritten Runde) zu erhalten. 

) d) Seguenzanalyse 

Die cDNA- Inserts von rekombinanten Phagen wurden in den 
Polylinker von pBluescript KS (Stratagene) subkloniert 
und auf einem automatischen Sequenzer (Applied 
Biosystems) unter Verwendung der Didesoxy-Methode 
sequenziert. Die komplette Sequenz von wenigstens zwei 
unabhangigen Isolaten pro erhaltenen Gen wurde mittels 
"Primer walking", ermittelt. Die Sequenzen wurden mit 
dem GCG-Sof tware-Paket (University of Wisconsin) 
analysiert, die Untersuchung auf Homologie wurde mit 
dem "Blast and fasta" oder "tfasta" Netzwerkservice 
durchgef uhrt . Die kompletten Sequenzen von EZH2 und 
' SUV39H sind in Fig. 6 und 7 dargestellt. 
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Patentanspriiche 

1. DNA-Molekiile, enthaltend eine fur ein 
Chromatinregulator-Protein, das eine SET-Doraane 
aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , da£ 
sie die in Fig. 6, Fig. 7 oder Fig. 8 
dargestellte Nukleotidsequenz , kodierend fur 
EZH2, SUV39H oder EZH1, einschlieSlich ihrer 
degenerierten Varianten sowie Mutanten davon, 
enthalten . 

2. DNA-Molekul nach Anspruch 1, dadurch 
gekennzeichnet, da£ es eine cDNA ist. 

3. DNA-Molekul nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, daS es humanen Ursprungs ist. 

4. cDNA nach Anspruch 3 der Bezeichnung EZH2 . 

5 . cDNA nach Anspruch 3 der Bezeichnung SUV39H. 

6 . DNA-Molekul nach Anspruch 4 , dadurch 

gekennzeichnet, daS es die fur die SET-Domane 
von EZH2 kodierende Region oder einen Abschnitt 
davon enthalt . 

7. DNA-Molekiil nach Anspruch 5, dadurch 

gekennzeichnet, daS es die fur die SET-Domane 
SUV39H kodierende Region oder einen Abschnitt 
davon enthalt . 

8 . DNA-Molekul nach Anspruch 4 , dadurch daS es f iir 

eine dominant -negative Mutante von EZH2 kodiert. 
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9. DNA-Molekiil nach Anspruch 4, dadurch dafi es fur 
eine dominant -negative Mutante vori SUV39H 
kodiert . 

10. Rekombinantes DNA-Molekiil, enthaltend eine in 
Anspruch 2 definierte cDNA, funktionell 
verbunden mit Expressionskontrollsequenzen, zur 
Expression in prokaryotischen oder 
eukaryotischen Wirtsorganismen . 

) .11- Prokaryotische oder eukaryotische 

Wirtsorganismen, transf ormiert mit rekombinanter 
DNA nach Anspruch 10. 

12 . Rekombinantes humanes Chromatinregulator- Protein 

EZH2 oder ein Abschnitt davon, erhaltlich durch 
Expression einer in Anspruch 4 definierten cDNA. 

' 13. Rekombinantes humanes Chromatinregulator- Protein 

SUV39H oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 definierten 
cDNA.. 

J 14. Antikorper gegen EZH2. 

15. Antikorper gegen SUV39H. 

16. Antisense (desoxy) ribonukleotide mit 
Komplementaritat zu einer Teilseguenz einer in 
Anspruch 1 definierten DNA. 

17. DNA-Molekul, kodierend fur die SET-Domane eines 
Chromatinregulator-Gens, bzw. fur einen 
Abschnitt davon, zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine 
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Deregulation von Chromat inregulat or - Genen , die 
eine SET-Dbmane aufweisen, zuruckzuf iihren sind. 

18 . DNA-Molekul nach Anspruch 6 oder 7 zur 

Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromat inregulat or-Genen, die eine SET-Domane 
aufweisen, zuruckzuf iihren sind. 

19 . Antikorper nach Anspruch 14 oder 15 zur 

Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromat inregulat or- Genen, die eine SET-Domane 
aufweisen, zuruckzuf iihren sind. 

20. Transgene Maus, enthaltend ein Transgen fur die 
Expression eines Chromat inregul at or - Gens , das 
eine SET-Domane aufweist, oder einer mutierten 
Version eines solchen Proteins. 

21. Knock-out Maus, erhaltlich aus embryonalen 
Stammzellen, in denen die endogenen Maus-Loci 
fur Ezhl und Suv39h durch homologe Rekombination 
unterbrochen wurden. 

22. Verfahren zum Identif izieren von Saugetier- 
Chromat inregul a tor - Genen , die eine SET-Domane 
aufweisen, oder mutierten Versionen davon, 
dadurch gekennzeichnet , daS.raan Saugetier-cDNA- 
oder genomische DNA-Bibliotheken unter 
Bedingungen niedriger Stringenz mit einem DNA- 
Molekul, kodierend fiir die SET-Domane oder einen 
Abschnitt davon, hybridisiert . 
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Fig. 6/1 



EZH2 Lange: 2600bp (kodierend: 90-2330) 



1 AGGCAGTGGAGCCCCGGCGGCGGCGGCGGCGGCGCGCGGGGGCGACGCGCGGGAACAAeG 60 

6 1 CGAGTCGGCGCGCGGGACG AAGAATAATC ATGGGCCAGACTGGGAAGAAATCTG AGAAGG 120 

MGQTGKKSEKG 

121 GACCAGTTTGTTGGCGGAAGCGTGTAAAATCAGAGTACATGCGACTGAGACAGCTCAAGA 180 
PVCW RKRVKSEYM RI* R Q L K R 

181 GGTTCAGACGAGCTGATGAAGTAAAGAGTATGTTTAGTTCCAATCGTCAGAAAATTTTGG 240 
F RRADEVKSMFSSNRQKILE 

241 AAAGAACGGAAATCTTAAACCAAGAATGGAAACAGCGAAGGATACAGCCTGTGCACATCC 300 
RTEILNQEWKQRRIQPVHIL 

301 TGACTTCTGTGAGCTCATTGCGCGGGACTAGGGAGTGTTCGGTGACCAGTGACTTGGATT 3 60 
TSVSS LRGT RECSVT SDLD F 

361 TTCCAACACAAGTCATCCCATTAAAGACTCTGAATGCAGTTGCTTCAGTACCCATAATGT 420 
P TQVI PLKTLN AVASVP I MY 

421 ATTCTTGGTCTCCCCTACAGCAGAATTTTATGGTGGAAGATGAAAGTGTTTTACATAACA 480 
SWSPLQQNFMVEDETVLHNI 

481 TTCCTTATATGGGAGATGAAGTTTTAGATCAGGATGGTACTTTCATTGAAGAACTAATAA 54 0 
P YMGDEVLDQDGT FI EEL IK 

541 AAAATTATGATGGGAAAGTACACGGGGATAGAGAATGTGGGTTTATAAATGATGAAATTT 600 
NYDGKVH GDRECGFI NDEI F 

601 TTGTGGAGTTGGTGAATGCCCTTGGTCAATATAATGATGATGACGATGATGATGATGGAG 660 
VELV NALGQYNDDDD D DDGD 

661 ACGATCCTGAAGAAAGAGAAGAAAAGCAGAAAGATCTGGAGGATCACCGAGATGATAAAG 720 
DP EEREEK QKDLEDH RDDKE 

721 AAAGCCGCCCACGTCGGAAATTTCCTTCTGATAAAATTTTTGAAGCCATTTCCTCAATGT 780 
SRPPRKFPSDKI FEAISSMF 

781 TTCCAG ATAAGGGC ACAGCAG AAGAACTAAAGG AAAAAT ATAAAGAACTC ACCG AAC AGC 840 
PDKGTAEELKEKYKE LTEQQ 

841 AGCTCCCAGGCGCACtTCCTCCTGAATGTACCCCCAACATAGATGGACCAAATGCTAAAT 900 
LPGALPPECTPNIDGP-NAKS 

• • ■ • • • 

901 CTGTTCAGAGAGAGC AAAGCTTACACTCCTTTCATACGCTTTTCTGTAGGCGATGTTTTA 960 
VQREQSLHSF HTLFC RRCFK 

961 AATATGACTGCTTCCTACATCCTTTTCATGCAACACCCAACACTTATAAGCGGAAGAACA 1020 
YDCFLHPFHATPNTY KRKNT 

• ■ • • ■ • 

1021 CAGAAACAGCTCTAGACAACAAACCTTGTGGACCACAGTGTTACCAGCATTTGGAGGGAG 1080 
ETALDNKPC GPQCYQHLEGA 

1081 CAAAGGAGTTTGCTGCTGCTCTCACCGCTGAGCGGATAAAGACCCCACCAAAACGTCCAG 114 0 
K EFAAALTAERIKTP PKRPG 
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„ * • • • • 

1141 GAGGCCGCAGAAGAGGACGGCTTCCCAATAACAGTAGCAGGCCCAGCACCCCCACCATTA 12 0 0 
GRRRGRLP'NNSSRPSTPTIN 

1201 ATGTGCTGGAATCAAAGGATACAGACAGTGATAGGGAAGCAGGGACTGAAACGGGGGGAG 1260 
VLESKDTDS DREAGTE TGGE 

1261 AGAACAATGATAAAGAAGAAGAAGAGAAGAAAGATGAAACT TCGAGC TC C TCT GAAGCAA 1320 
NNDKEEEEKKDETSSSSE AN 

• * * 

1321 ATTCTCGGTGTCAAACACCAATAAAGATGAAGCCAAATATTGAACCTCCTGAGAATGTGG 1380 

S RC Q T P I KM K PH. I. E P P E NVE 

1381 AGTGGAGTGGTGCTGAAGCCTCAATGTTTAGAGTCCTCATTGGCACTTACTATGACAATT 1440 
W S GA E A S MF RVL I G T Y Y DK F 

• • • • • • ■ 
1441 TCTGTGCCATTGCTAGGTTAATTGGGACCAAAACATGTAGACAGGTGTATGAGTTTAGAG 1500 

C A I A R L IGTKTCRQVYEFRV 

• • • • * 

1501 TCAAAGAATCTAGCATCATAGCTCCAGCTCCCGCTGAGGATGTGGATACTCCTCCAAGGA 1560 
K E S S I I APAPAEDVDT PPRK 

• • - • • • 

1561 AAAAGAAGAGGAAACACCGGTTGTGGGCTGCACACTGC AGAAAGATAGAGCTGAAAAAGG 1620 
KKRKHRLWAAHC RKI Q LKKD 

- 

1621 ACGGCTCCTCTAACCATGTTTACAACTATCAACCCTGTGATCATCCACGGCAGCCTTGTG 1 6 B 0 
G SSNHVYNYQPCDHP RQPCD 

• • • • * 

1681 ACAGTTCGTGCCCTTGTGTGATAGCACAAAATTTTTGTGAAAAGTTTTGTCAATGTAGTT 1740 
SSCPCVIAQN FCEKFCQCSS 
. • • • 

1741 CAGAGTGTCAAAACCGCTTTCCGGGATGCCGCTGCAAAGCACAGTGCAACACCAAGCAGT 1800 
ECQNR F P GCRCKAQC N TKQ C 

1801 GCCCGTGCTACCTGGCTGTCCGAGAGTGTGACCCTGACCTCTGTCTTACTTGTGGAGCCG 1860 
PCYLAVRECDPDLCIiTCGAA 

1861 CTGACCATTGGGACAGTAAAAATGTGTCCTGCAAGAACTGCAGTATTCAGGGGGGCTCCA 1920 
DHWD5KNV5CKN. CSX QRGSK 

• • - • * 

1921 AAAAGGATCtATTGCTGGCACCATCTGACGTGGCAGGCTGGGGGATTTTTATCAAAGATC 1980 
KHLLLAP SDVAGWGIFIKDP 

• - • • • • . 

1981 CTGTGCAGAAAAATGAAT TCATCTCAGAAT ACTGTGGAGAGATTATTTCTCAAGATGAAG 2040 
VQKNEFISEYCGEII SQDEA 

2041 CTGACAGAAGAGGGAAAGTGT ATGAT AAATACATGTGCAGCTTTCTGTTCAACTTGAACA 2100 
DRRGKVYDKYMCSFLFNLNN 

2101 ATGATTTTGTGGTGGATGCAACCGGCAAGGGTAACAAAATTCGTTTTGCAAATCATTCGG 2160 
D FVVDA T R KGNK I RF ANH SV 
- 

2161 TAAATCCAAACTGCT ATGCAAAAGTT ATGATGGTTAACGGTGATCACAGGATAGGTATTT 2220 
N PNCYA KVMMVNGDH RIGIF 
. ♦ . • 

2221 TTGCCAAGAGAGCCATCCAGACTGGCGAAGAGCTGTTTTTTGATTACAGATACAGCCAGG 2280 
AKRAI Q TGEELFFDYRYSQA 
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2281 CTGATGCCCTGAXGTATGTCGGCATCGAAAGAGAAATGGAAATCCCTTGACATCTGCTAC 2340 
DALKYVGIEREMEIP* 

2341 CTCCTCCCCCTCCTCTGAAACAGCTGCCTTAGCTTCAGGAACCTCGAGTACTGTGGGCAA 2400 

.... 

2401 TTTAGAAAAAGAACATGCAGTTTGAAATTCTGAATTTGCAAAGTACTGTAAGAATAATTT 2460 

2461 ATAGTAATGAGTTTAAAAATCAACTTTTTATTGCCTTCTCACCAGCTGCAAAGTGTTTTG 2520 

2521 TACCAGTGAATTT T TGCAATAATGCAGTATGGT AGATT TTTCAACTTTGAATAAAGAATA 2580 
2581 CTTGAACTTGTCAAAAAAAA 2600 
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Fig. 7/1 

SUV39H Lange: 2732 bp (kodierend: 45-1284) 



3 



1 TCGCGAGGCGGGCTAGGCCCGAATGTCGTTAGCCGTGGGGAAAGATGGCGGAAAATTTAA 60 

M A E N L K 

• • • • * • 

61 AAGGCTGCAGCGTGTGTTGCAAGTCTTCTTGGAATCAGCTGCAGGACCTGTGCCGCCTGG 120 
GCSVCCKSSWNQLQDLCRLA 

• ••••• 

121 CCAAGCTCTCCTGCCCTGCCCTCGGTATCTCTAAGAGGAACCTCTATGACTTTGAAGTCG 180 
KLSCPALGI SKRNLYDFEV E 

18 1 AGTACCTGTGCGATTAC AAGAAGATCCGCGAACAGGAATATTACCTGGTGAAATGGCGTG 240 
Y L CDY K K I REQEYYLVK WRG 

241 GATATCCAGACTC AGAGAGCACCTGGGAGCGACGGCAGAATCTCAAGTGTGTGCGTATCC 300 
YP. DSESTWEPRQNLKCVRIL 

301 TCAAGCAGTTCCACAAGGACTTAGAAAGGGAGCTGCTCCGGCGGCACCACCGGTCAAAGA 360 
KQ FHKDLERELLRRHHRSKT 

361 CCCCCCGGCACCTGGACCCAAGCTTGGCCAACTACCTGGTGCAGAAGGCCAAGCAGAGGC 420 
P R H LD P S It A N Y LVQK AK QRR 

421 GGGCGCTCCGTCGCTGGGAGCAGGAGCTCAATGCCAAGCGCAGOCATCTGGGACGCATCA 480 
ALRRWEQEL NAKRSHLGRIT 

• • • • • • 

481 CTGTAGAGAATGAGGTGGACCTGGACGGCCCTCCGCGGGCCTTCGTGTACATCAATGAGT 540 
VENEVDLDGPP RAFVY I N E Y 

54 1 ACCGTGTTGGTGAGGGCATCACCCTCAACCAGGTGGCTGTGGGCTGCGAGTGCCAGGACT 600 
RVGEG I TLNQVAVGCECQDC 

• ■ • • • • 

601 GTCTGTGGGCACCCACTGGAGGCTGCTGCCCGGGGGCGTCACTGCACAAGTTTGCCTACA 660 
L W A P T GGCCPGASLHKFAY N 

• * * • • • 

661 ATGACC AGGGCCAGGTGCGGCTTCG AGCCGGGCTGCCCATCTACGAGTGC AACTCCCGCT 720 
DQGQVRLRAGLPIYE CNSRC 

72 1 GCCGCTGCGGCTATGACTGCCCAAATCGTGTGGTACAGAAGGGTATCCGATATGACCTCT 780 
RCGYD CP NRVVQ KGI R Y D I* C 

781 GCATCTTCCGGACGGATGATGGGCGTGGCTGGGGCGTCCGCACCCTGGAGAAGATTCGCA 840 
IFRTDDGRGWGVRT LEKIRK 

841 AGAACAGCTTCGTCATGGAGTACGTGGGAGAGATCATTACCTCAGAGGAGGCAGAGCGGC 900 
NSF VMEYVGEI I TSEEAERR 

90 1 GGGGCCAGATCTACGACCGTCAGGGCGCCACCTACCTCTTTGACCTGGACTACGTGGAGG 960 
GQIYDRQGATYLFDLDYVED 

• * • • 

961 ACGTGTACACCGTGGATGCCGCCTACTATGGCAAGATCTCCCACTTTGTC AACCACAGTT 1020 
VYTVDAAYYGN ISHFVNHSC 

• • • > • ■ » 

1021 GTGACCCCAACCTGCAGGTGTACAACGTCTTCATAGACAACCTTGACGAGCGGCTGCCCC 1080 
DPNLQVYNVFI DNLDERLPR 

1081 GCATCGCTTTCTTTGCCACAAGAACCATCCGGGCAGGCGAGGAGCTCACCTTTGATTACA 1140 
IAFFATRTIRAGEELTFDYN 
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1141 ACATGCAAGTGGACCCCGTGGACATGGAGAGCACCCGCATGGACTCCAACTTTGGCCTGG 1200 
MQVD-PVDMES TRMD SN F G L A 

1201 CTGGGCTCCC7GGCTCCCCTAAGAAGCGGGTCCGTATTGAATGCAAGTGTGGGACTGAGT 1260 
GLPGSPKKRVRIECKCG TES 

1261 CCTGCCGCAAATACCTCTTCTAGCCCTTAGAAGTCTGAGGCCAGACTGACTGAGGGGGCC 1320 
C R K Y L F * 

1321 TGAAGCTACATGCACCTCCCCCACTGCTGCCCTCCTGTCGAGAATGACTGCCAGGGCCTC 1380 

1381 GCCTGCCTCCACCTGCCCCCACCTGCTCCTACCTGCTCTACGTTCAGGGCTGTGGCCGTG 1440 

1441 GTGAGGACCGACTCCAGGAGTCCCCTTTCCCTGTCCCAGCCCCATCTGTGGGTTGCACTT 1500- 

1501 ACAAACCCCCACCCACCTTCAGAAATAGTTTTTCAACATCAAGACTCTCTGTCGTTGGGA 1560 

1561 TTCATGGCCTATTAAGGAGGTCCAAGGGGTGAGTCCCAACCCAGCCCCAGAATATATTTG 1620 

1621 TTTTTGCACCTGCTTCTGCCTGGAGATTGAGGGGTCTGCTGCAGGCCTCCTCCCTGCTGC 1680 

1681 CCCAAAGGTATGGGGAAGCAACCCGAGAG.CAGGCAGACATCAGAGGCC AGAGTGCCTAGC 1740 

1741 CCGACATGAAGCTGGTTCCCCAACCACAGAAACTTTGTACTAGTGAAAGAAAGGGGTCCC 1800 

1801 TGGCCTACGGGCTGAGGCTGGTTTCTGCTCGTGCTTACAGTGCTGGGTAGTGTTGGCCCT 18 60 

1861 AAGAGCTGTAGGGTGTCTTCTTCAGGGCTGCATATCTGAGAAGTGGATGCCCACATGCCA 1920 

1921 CTGGAAGGGAAGTGGGTGTCCATGGGCCACTGAGCAGTGAGAGGAAGGCAGTGCAGAGCT 1980 

1981 GGCCAGCCCTGGAGGTAGGCTGGGACCAAGCTCTGCCTTCACAGTGCAGTGAAGGTACCT 2040 

2041 AGGGCTCTTGGGAGCTCTGCGGTTGCTAGGGGCCCTGACCTGGGGTGTCATGACCGCTGA 2100 

2101 CACCACTCAGAGCTGGAACCAAGATCTAGATAGTCCGTAGATAGCACTTAGGACAAGAAT 21 60 

2161 GTGCATTGATGGGGTGGTGATGAGGTGCCAGGCACTAGGTAGAGCACCTGGTCCACGTGG 2220 

2221 ATTGTCTCAGGGAAGCCTTGAAAACCACGGAGGTGGATGCCAGGAAAGGGCCCATGTGGC 2280 

2281 AGAAGGCAAAGTACAGGCCAAGAATTGGGGGTGGGGGAGATGGCTTCCCCACTATGGGAT 2340 

2341 GACGAGGCGAGAGGGAAGCCCTTGCTGCCTGCCATTCCCAGACCCCAGCCCTT-TGTGCTC 24 00 

• • • • • • 

2401 ACCCTGGTTCCACTGGTCTCAAAAGTGACCTGCCTACAAATGTACAAAAGGCGAAGGTTC 24 60 

2461 TGATGGCTGCCTTGCTCCTTGCTCCCGCACCCCCTGTGAGGACTTCTCTAGGAAGTCCTT 2520 

2521 CCTGACTACCTGTGCCCAGAGTGCCCCTACATGAGACTGTATGCCCTGCTATCAGATGCC 2580 

2581 AGATCTATGTGTCTGTCTGTGTGTCCATCCCGCCGGCCCCCCAGACTAACCTCCAGGCAT 2640 

• • • • • • 

2641 GGACTGAATCTGGTTCTCCTCTTGTACACCCCTCAACCCTATGCAGCCTGGAGTGGGCAT 2700 

2701 CAATAAAATGAACTGTCGACTGAAAAAAAAAA 2732 
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1844 TCTTACTTGTGGAGCCGCTGACCATTGGGACAGTAAAAATGTGTCCTGCA 18 93 

i I I I Mill III I II II I I I I I I t II II I I I I I I 

1 ACTCACCTGTGGGGCCTCAGAGCACTGGGACTGCAAGGTGGTTTCCTGTA 50 

18 94 AGAACTGCAGTATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGCACCA 1943 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 1 

51 AAAACTGCAGCATCCAGCGTGGACTTAAGAAGCACCTGCTGCTGGCCCCC 100 

w . .. 

194 4 TCTGACGTGGCAGGCTGGGGGATTTTTATCAAAGATeCTGTGCAGAAAAA^ 1993 
Mi! I I 1 I II 1 i til I I II III II I 1 M I I Mil I I M 
101 TCTGATGTGGCC^ATGGGGCA 150 



1994 
151 



TGAATTCATCTCAGAATACTGTGGAGAGATT ATTTCTCAAGATG AAGCTG 2 043 

III III M I I MM I I Ml Ml M l M I M M lilt I MM 
Vtgaattcatttctg^ 2 00 

V - - - • 

2 04 4 acagaagagggaaagtgtatgataaatacatgtgcagctttctgttcaac 2 0 93 
i M I J I M M MM! M I M I M M I M II I II I I I M I 
2 01 ATCGACGCGGAAAGGTCTATGACAAATACATGTCCAGCTTCCTCTTCAAC 250 



2 094 TTGAACAATGATTTTGTGGTC 2143 
I M I M I I Ml I M I M II M I I I M M II M I I II 1 M M 
251 CTCAATAATGATTTTGTAGTGGATGCTACTCGGAAAGGAAACAAAATTCG 30 0 

2144 TTTTGCAAATCATTCGGTAAATCCAAACTGCTATGCAAAAGTT. .ATGAT 2191 

I M I I I M I 1 M II M Mill I M M MM III 111 I 

301 ATTTGCAAATCATTCAGTGAAT^ 350 

GGTTAACGGTGATCACAGGATAGGTATTTTTGCCAAGAGAGCCATCCAGA 2241 

II I I I II II MM MM 5 
AGTAACCTGGGAGGTGGGGTGGGGGATGGA^ 4 00 

CTGGCGAAGAGCTGTTTTTTGATTACAGATACAGCCAGGCTGATGCCCTG 2291 
i ll) MM Ml I 1 

C AT TCGTTGTT G AAC AT T T T CC T TAG C T GA G CT AT C T T T T G T C C AAAG AT 4 50 
22 92 AAGTATGTCGGCATCGAAAGAGAAATGGAAATCCCTTGA * 2330 

m iii i r -i , i : ; : 1 I M 

451 AATCATGATTAATATCTGGT 48 9 



2192 
351 

2242 
401 
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